max rank | avg. rank | sentence |
---|---|---|
212 | 61.1000 | La sua non è stata una vita come le altre. |
288 | 128.2500 | Da quattro anni e per molti altri ancora. |
289 | 116.7143 | Non potrebbe essere questa la nostra ora? |
298 | 155.8571 | È un servizio pubblico al servizio pubblico. |
369 | 157.1250 | Una famiglia di tre quattro, poi un altro. |
387 | 187.5000 | ” era il titolo della seconda giornata. |
433 | 132.0000 | È solo questione di rispetto degli altri. |
444 | 145.4286 | Nel 2015 è stata presidente della Confederazione. |
453 | 202.2500 | Berna non sarebbe Berna se così non fosse! |
472 | 145.2500 | Questa era la cosa più difficile di tutto. |
481 | 124.6667 | È davvero quello il suo nuovo posto di lavoro? |
481 | 222.3333 | È davvero una situazione molto difficile". |
484 | 197.2000 | A scuola e in paese non aveva mai dato problemi. |
484 | 126.0000 | Ma la scuola, il lavoro, la società in generale. |
488 | 208.3333 | In gioco c’è la sicurezza pubblica del nostro Cantone. |
494 | 191.5455 | Il tema della scuola, della formazione, è forse il più importante. |
497 | 186.6000 | Il problema è che non c’è proprio nulla da vedere. |
505 | 153.3333 | Dopo 25 anni dunque, siamo ancora qui: come prima, più di prima! |
511 | 161.7500 | E questo ha sempre avuto un ruolo importante. |
526 | 223.7000 | Come nelle donne anche negli uomini non c'è stata finale. |
531 | 145.1000 | E per me la persona è al centro di tutto! |
538 | 276.6250 | ! sei bella sempre in aprile, maggio, giugno, luglio. |
568 | 146.8750 | In Svizzera abbiamo oltre due milioni di stranieri. |
581 | 165.5000 | Sono però sulla via di un controllo totale dello Stato, è solo una questione di tempo. |
604 | 209.6364 | In questo momento di difficoltà abbiamo bisogno del sostegno del pubblico! |
606 | 154.3750 | In politica tutto, o quasi tutto, è permesso. |
609 | 113.1111 | Non solo in Europa, ma in tutto il mondo. |
627 | 208.9167 | Oggi ho dato il massimo, per me e per tutta la squadra. |
628 | 186.1875 | “Il problema è un problema di sistema che avrebbe dovuto essere messo a posto tempo fa. |
628 | 250.5000 | Sono sempre io, questa volta però ho messo il mio vero nome. |
The maximum word rank of a sentence is by definition the rank of the rarest word in the sentence. If it is low, all words in the sentence are of high frequency. For this reason the table of the sentences with least maximum word number might be of interest. In the table, we see the corresponding sentences with a minimum length of 40 characters.
The over all distribution of the maximum rank in all sentences of the corpus is shown in a diagram with log-scaled x-axis.
The sentences in the table described above are of interest because they are usually easy to understand. The distribution may give insights into the corpus and may give parameters for language comparison.
While the distribution might be deduced from a small corpus, the sentences in the table are rare and a large corpus will give more impressive results.
Table data:
select max(w_id)-100 as m, avg(w_id)-100 as a, s.sentence from sentences s, inv_w i where s.s_id=i.s_id and length(sentence)>40 and i.w_id>100 group by s.s_id order by m limit 30;
Distribution data;
select m, count(*) from (select 100* round((max(w_id)-100)/100) as m from sentences s, inv_w i where s.s_id=i.s_id and i.w_id>100 group by s.s_id) aa group by m;
Explain the distribution, especially the increase in its right part.
4.5.2.2 Average word rank in sentence
4.5.2.3 Sentences consisting of many low frequency words I
4.5.2.4 Sentences consisting of many low frequency words II
4.5.2.5 Sentences consisting of short words only I
4.5.2.6 Sentences consisting of short words only II
4.5.2.7 Sentences consisting of long words only I
4.5.2.8 Sentences consisting of long words only II